检索结果

期刊

出版年

关键词

Please wait a minute...

选择:

导出引用
EndNote Ris BibTeX

显示/隐藏图片

Select

1. 进化操作行为学习模型及在移动机器人避障上的应用

郜园园朱凡宋洪军

计算机应用 2013, 33 (08): 2283-2288.

摘要（921）

PDF （993KB）（337）

针对移动机器人避障上存在的自适应能力较差的问题，结合遗传算法(GA)的进化思想，以自适应启发评价(AHC)学习和操作条件反射(OC)理论为基础，提出了一种基于进化操作行为学习模型(EOBLM)的移动机器人学习避障行为的方法。该方法是一种改进的AHC学习模式，评价单元采用多层前向神经网络来实现，利用TD算法和梯度下降法进行权值更新，这一阶段学习用来生成取向性信息，作为内在动机决定进化的方向；动作选择单元主要用来优化操作行为以实现状态到动作的最佳映射。优化过程分两个阶段来完成，第一阶段通过操作条件反射学习算法得到的信息熵作为个体适应度，执行GA学习算法搜索最优个体；第二阶段由OC学习算法选择最优个体内的最优操作行为，并得到新的信息熵值。通过移动机器人避障仿真实验，结果表明所设计的EOBLM能使机器人通过不断与外界未知环境进行交互主动学会避障的能力，与传统的AHC方法相比其自学习自适应的能力得到加强。